- TF23AI联邦学习的最新应用落地
- TF22数据驱动
- TF21 认知智能落地中的问题与对策
- TF20 深度学习技术和框架应用
- TF19 未来智能设备的交互技术
- TF18 数据安全与风险防控
- TF17 认知计算产业化落地
- TF16 NewSQL探索与实践
- TF15 Cloud Native 云原生时代的架构
- TF14 联邦学习技术及数据隐私保护
- TF13 大数据时代背景下数字内容生产行业的技术变迁
- TF12 语言认知与知识计算
- TF11 容器化和Service Mesh实践
- TF10 AI在智慧媒体领域的应用
- TF09 人机对话的产业应用与技术发展
- TF08 企业数据安全建设实践
- TF07 大数据在新零售中的应用
- TF06 工程师职业发展及组织文化概况
- TF05 区块链技术与工程实践研讨会
- TF04 纵论AI在问答、机器翻译、自动驾驶、人脸识别中的应用
- TF03 大数据系统与应用
- TF02 人工智能时代的互联网运维
- TF01 微服务实践
会议主席
章文嵩
滴滴出行高级副总裁,兼任滴滴技术委员会主席。同时章文嵩也是CCF TF技术前线委员会主席,LVS开源项目创始人。曾任阿里副总裁和阿里云CTO。
会议执行主席
来炜
来炜,滴滴出行运维总监。2015年加入滴滴,担任运维总监。国内最流行的开源企业级监控系统Open-Falcon的创始人和社区负责人。2008年毕业于中国科大,曾任职百度运维部和小米。
特邀讲者
王博
主题报告一:百度智能运维实践之异常检测
主题简介:在百度设计和实现智能监控系统,面临着巨大挑战:业务种类、特性繁多,流量、收入规模大、影响面广,稳定性、时效性要求高。本报告基于监控系统中的一个重要特性——异常检测介绍百度如何准确、高效地进行10亿级的运维时序数据分析:
1、异常检测的算法介绍和百度的调优实践;
2、大规模时序数据的采集-存储-计算架构。
个人简介:王博,百度资深工程师,2014年加入百度,先后参与异常检测系统的设计开发、报警收敛、故障诊断等相关工作,目前是异常检测系统的技术负责人。
姚睿尧
主题报告一:百度智能运维实践之异常检测
主题简介:在百度设计和实现智能监控系统,面临着巨大挑战:业务种类、特性繁多,流量、收入规模大、影响面广,稳定性、时效性要求高。本报告基于监控系统中的一个重要特性——异常检测介绍百度如何准确、高效地进行10亿级的运维时序数据分析:
1、异常检测的算法介绍和百度的调优实践;
2、大规模时序数据的采集-存储-计算架构。
个人简介:姚睿尧,百度高级研发工程师,2015年硕士毕业于北京大学并加入百度,负责百度运维大数据存储平台的设计和研发,致力于追求大规模存储系统的高性能和高可用。
潘成龙
主题报告一:百度智能运维实践之异常检测
主题简介:在百度设计和实现智能监控系统,面临着巨大挑战:业务种类、特性繁多,流量、收入规模大、影响面广,稳定性、时效性要求高。本报告基于监控系统中的一个重要特性——异常检测介绍百度如何准确、高效地进行10亿级的运维时序数据分析:
1、异常检测的算法介绍和百度的调优实践;
2、大规模时序数据的采集-存储-计算架构。
个人简介:潘成龙,百度高级研发工程师,2015年硕士毕业于中科院计算所,当年加入百度,负责监控系统的数据采集和汇聚计算系统的设计和研发。
吉青
主题报告二:大型数据中心运维实践和趋势分析
主题简介:近年来随着互联网行业的发展,数据中心数量激增,数据的规模和模式不断刷新纪录。这个后期的运营和维护工作带来了极大的挑战。当前比较流行的做法是人工运维与智能运维相结合。把一些常见、耗时的值守类工作交给智能运维。而人工运维更多的集中在突发事件和新问题的处理以及新技术的应用等方面。本次分享,主要探讨以下方面:
1、数据中心的发展历程与挑战;
2、ITIL 、ITSM与IT运维;
3、自动化运维的实现与趋势;
4、银行、电信、高校等特定领域数据中心运维案例分析。
个人简介:吉青,曙光高性能产品事业部副总经理,中国科学院化学研究所博士,先后在法国国家科学研究中心和美国麻省理工学院担任博士后研究员。2015年加入曙光,任高性能产品事业部副总经理,并主持在线运维EasyOP的运营和研发等相关工作。截止2017年7月,EasyOP已经接入100+个数据中心,服务近万个节点。
李培龙
主题报告三:海量数据场景下的智能监控与定位
主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:
1、海量特征指标采集;
2、高效的时间序列化存储;
3、实时报警;
4、基于机器学习的故障检测;
5、基于trace的精准定位等能力的建设经验。
个人简介:李培龙,滴滴出行高级专家工程师,2015年加入滴滴出行,组建质量架构团队,负责滴滴的Trace调用链追踪与问题定位系统、基于机器学习的异常检测系统和全链路压测平台。
聂安安
主题报告三:海量数据场景下的智能监控与定位
主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:
1、海量特征指标采集;
2、高效的时间序列化存储;
3、实时报警;
4、基于机器学习的故障检测;
5、基于trace的精准定位等能力的建设经验。
个人简介:聂安安,滴滴出行资深软件开发工程师,主要从事运维平台开发、监控体系建设等相关工作,Open-Falcon开源社区核心Committer之一。
贺百灵
主题报告三:海量数据场景下的智能监控与定位
主题简介:探讨海量数据场景下,故障的实时发现和精准定位体系建设。该报告由三位资深讲师分别发表演讲,内容主要包括:
1、海量特征指标采集;
2、高效的时间序列化存储;
3、实时报警;
4、基于机器学习的故障检测;
5、基于trace的精准定位等能力的建设经验。
个人简介:贺百灵,滴滴出行高级软件开发工程师,2015年加入滴滴,先后负责LBS、分抢单策略、出租车反作弊系统的测试工作,现阶段主要负责智能运维方向异常检测相关算法的研究与实现。
许亚南
主题报告四:故障定位系统「雷达」的设计实现
主题简介:随着美团点评业务规模快速增长,业务及服务间调用越来越复杂,一个基础服务或设施的异常可能会导致大量上游依赖业务异常,同时伴随着异常引发各类监控的告警风暴,给快速定位故障根源快速止损处理造成了极大的不便。所以,我们设计和开发了故障雷达系统,以便遇到故障时可以快速找到故障根源进行处理。本次演讲主要介绍root cause自动定位系统「雷达」的设计实现。
个人简介:许亚南,美团点评运维部自动化开发工程师,美团点评运维自动化开发团队核心成员,致力于自动故障分析、智能监控等系列产品的设计和开发。
谢文辉
主题报告五:大规模流量接入系统的设计和实践
主题简介:随着京东业务规模的快速增长和全站https落地实施,6.18/11.11 用户流量峰值给流量接入体系的性能和高可用性建设带来了更多挑战。在这个过程中,我们逐步构建和完善了智能DNS系统,高性能反向代理和负载均衡,数据分析展现,公网流量调度等配套系统平台,协同支撑大规模流量接入和调度。本次主题将介绍这套流量接入平台构建实践以及相关问题和解决方案。
个人简介:谢文辉,京东技术保障部架构师,2016年加入京东,负责技术保障部流量接入平台设计研发,构建支撑京东6.18极端峰值流量的接入架构。